11.2 数据库

11.2.1 DB2

监控目的:

用于监控DB2数据库,提供数据库最关键的性能数据和资源使用状况。

监控前提:

监视器与被监控数据库间网络连通,配置的用户属于SYSMON_GROUP组,具有系统表或者快照的查询权限。

监控数据:

1.数据库描述:数据库类型、版本、IP地址、端口、数据库服务名、开始时间、连接时间、节点数;

2.数据库详细说明:数据库名、数据库别名、数据库所在路径、选择的行数、直接读次数、死锁、索引页击中率、直接写、缓存击中率、数据库状态、更新行数、连接开始时间、删除的行数、catalog缓存击中率、排序溢出百分比、数据页击中率、插入行数、工作单元、成功的sql数、失败的sql数、缓冲池击中率、日志空间使用率;

3.表空间状态:名称、类型、状态、已分配字节、空闲字节、空闲率;

4.连接与代理:等待的代理数、本地连接、总连接、空闲代理数、远程连接、活动的代理数、DB2状态、代理总数。

输入参数

字段 含义
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
数据库地址 DB2数据库所在主机的地址。
服务端口 数据库的服务端口,默认为50000。
用户名 登录DB2数据库的用户名。用户需属于SYSMON_GROUP组,具有系统表或者快照的查询权限。
用户密码 用户名对应的密码。
数据库服务名 被监视的数据库服务名称。
监视数据 监视的数据,包括数据库描述、数据库性能、表空间、连接与代理,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
dbDescribe 数据库描述 db_type 数据库类型
version 版本
database_host IP地址
database_port 端口
server_instance_name 数据库服务名
db2start_time 开始时间
connected_time 连接时间
num_nodes_in_db2_instance 节点数
dbDetail 数据库详细说明 db_name 数据库名
input_db_alias 数据库别名
db_path 数据库所在路径
rows_selected 选择的行数
direct_reads 直接读次数
deadlocks 死锁
pool_index_p_hits_ratio 索引页击中率(%)
direct_writes 直接写
pkg_cache_hits_ratio Package缓存击中率(%)
db_status 数据库状态
rows_updated 更新行数
db_conn_time 连接开始时间
rows_deleted 删除的行数
cat_cache_hits_ratio Catalog缓存击中率(%)
sort_overflows_ratio 排序溢出百分比(%)
pool_data_p_hits_ratio 数据页击中率(%)
rows_inserted 插入的行数
work 工作单元
success_sql_stmts 成功的sql数
pool_hits_ratio 缓冲池击中率(%)
failed_sql_stmts 失败的sql数
log_usage_ratio 日志空间使用率(%)
tablespaceStat 表空间状态 tablespace_name 名称
type 类型
state 状态
allocated_size 已分配字节(MB)
meg_free_space 空闲字节(MB)
percent_free_space 空闲率(%)
connAndAgent 连接与代理 agents_waiting_on_token 等待Agent数
local_cons 本地连接
total_cons 总连接
idle_agents 空闲Agent数
rem_cons_in 远程连接
agents_active 活动Agent数
db2_status DB2状态
agents_registered Agent总数

11.2.2 Oracle

监控目的:

监视Oracle数据库的健康状况,性能以及资源使用状况。

监视前提:

确保本地代理能够监控到目标Oracle服务器,且地址为安装了本地代理的服务器IP地址。

监控数据:

1.击中率:库击中率、数据字典击中率、缓冲区击中率;

2.数据文件:文件名、状态、表空间名、读时间、平均读写时间、写时间、读次数、写次数;

3.数据库连接:连接数、用户数;

4.表空间:表空间名、总空间大小、可用空间、空闲块、空间可用率、已用块、已用空间、平均读写时间、写次数、写时间、读时间、状态、读次数;

5.回滚段:段名称、表空间名、击中率、增长率、最小长度、扩展、状态、最大长度、当前长度、WRAPS、收缩、初始长度、下一长度、HWM大小;

6.数据库:数据库名称、创建时间、保护模式、转换状态、数据库角色、控制文件类型、LOG模式、GUARD状态、保护级别、OPEN模式;

7.SGA:SGA块名称、大小;

8.会话:会话ID、用户名、激活状态、操作系统用户、操作系统进程ID、程序、状态、计算机名、CPU使用、内存使用、逻辑读、物理读、登入时间、处理事件;

9.锁详情:会话持有锁模式、锁定对象ID1、锁定对象ID2、请求持有锁模式、阻塞模式、锁类型、创建时间、会话ID;

10.锁定对象:回滚段号、槽号、序列号、持有锁会话、持有锁用户名、操作系统用户名、持有锁进程号、锁模式、持有锁对象、持有锁对象名、持有锁对象类型、锁定时间、触发锁事件、造成锁的SQL语句id。

11.锁统计:锁类型、锁个数;

输入参数

字段 含义
监视模式 包括:本地代理、远程模式
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
本地代理 主机地址 Oracle数据库所在主机的地址。
接入点 代理服务使用的接入点。
版本信息 被监视的Oracle数据库的版本信息。
数据源 被监视的Oracle数据源。可通过数据源列表选择,需先正确配置主机地址参数。
远程模式 数据库地址 被监视数据库的IP地址。
服务端口 服务端口,默认值为1521。
用户名 可登录数据库的用户名,配置的用户必须具有数据库系统性能表或视图的查询权限。
用户密码 用户名对应的密码。
数据库服务名 被监视的数据库服务的名称。
监视数据 监视的数据,包括击中率、数据文件、连接与用户、表空间、回滚段、数据库配置、SGA信息、会话、锁统计、锁详情和锁定对象,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
hits_ratio 击中率 libhits 库击中率
ddhits 数据字典击中率
buffer_hits 缓冲区击中率
dbFileStat 数据库文件 file_name 文件名
online_status 状态
tablespace_name 表空间名
readtim 读时间
avgiotim 平均读写时间
phywrts 写次数
phyrds 读次数
writetim 写时间
connAndUser 数据库连接和用户 connect_num 连接数
active_user 用户数
tablespaceStat 表空间 tablespace_name 表空间名称
total_space 总空间
free_space 可用空间(MB)
free_blocks 空闲快
free_pct 空间可用率
used_space 已用空间(MB)
avgiotim 平均读写时间
online_status 状态
count 数据库文件个数
contents 表内容
extent_management 区间管理方式
segment_space_management 碎片管理方式
roolbackSegStat 回滚段 segment_name 区段名称
tablespace_name 表空间名称
hits_ratio 击中率
pct_increase 区增长率
min_extents 最小区数
extents 区(个)
status 状态
max_extents 最大区数
cur_size 当前大小
wraps WRAP次数
shrinks SHRINK次数
initial_extent 初始区大小
next_extent 次级区大小
hwmsize HWM大小(MB)
dbDesc 数据库 name 数据库名称
created 创建时间
protection_mode 保护模式
switchover_status 转换状态
database_role 数据库角色
controlfile_type 控制文件类型
log_mode 日志模式
guard_status GUARD状态
protection_level 保护级别
open_mode OPEN模式
sgaStat SGA信息 name SGA块名称
bytes 大小(MB)
sessionStat 会话 sid 会话ID
username 用户名
status 激活状态
osuser 操作系统用户
spid 操作系统进程ID
program 程序
machine 计算机名
state 等待状态
cpu_used CPU使用
used_memory 内存使用
logical_reads 逻辑读
physical_reads 物理读
logon_time 会话登入时间
event 处理事件
lockStat 锁统计 type 锁类型
count 锁个数
lock 锁详情 lmode 会话持有锁模式
id1 锁定对象ID1
id2 锁定对象ID2
request 请求持有锁模式
block 阻塞模式
type 锁类型
ctime 锁定时间
sid 会话ID
lockObject 锁定对象 xidusn 回滚段号
xidslot 槽号
xidsqn 序列号
session_id 持有锁会话
oracle_username 持有锁用户名
os_user_name 操作系统用户名
process 持有锁进程号
locked_mode 锁模式
object_id 持有锁对象
object_name 持有锁对象名
object_type 持有锁对象类型
wait_time 锁定时间
event 触发锁事件
sqlid 造成锁的sql语句id
locktype 锁类型
mf_GetDLSession 死锁会话列表 Id 死锁环路编号
sid 会话编号
serial 会话子编号
spid 操作系统进程编号
username 连接用户名
machine 客户端机器名
program 客户端程序名
sql_text 当前执行的SQL语句
status 会话状态
host_name 主机名
host_address 主机地址
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.3 Oracle 日志

监控目的:

监视Oracle日志的状况。

监视前提:

关键字检索:为空表示检索全部日志(*,?模糊匹配多/单个字符),多个关键字以‘;’号隔开,目前暂不支持中文分号‘;’。

读取行数: 出于性能考虑,每次日志最大读取行数小于100行。

监控数据:

1.发生次数:日志异常出现次数;

2.异常内容:最近一次出现异常的内容;

3.日志级别:日志异常级别;

4.读取行数:一次分析读取日志行数;

输入参数:

字段 含义
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
地址 Oracle数据库日志所在主机的地址。
关键字检索 监视器检索日志时,使用的关键字。可为空,为空表示检索全部日志(*,?模糊匹配多、单个字符,多个关键字以”;”号隔开)
日志目录 Oracle日志存放的路径。
读取行数 监视器分析日志时每次读取的行数,最多不能超过100行。默认值为10.
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
warning 日志告警 DetailContent 异常内容
OccurTimes 告警出现次数
LogPosition 日志文件位置
Identity 日志标识
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.4 Sql Server

监控目的:

监视Sql Server数据库的健康状况,性能以及资源使用状况。

监控前提:

确保本地代理能够监控到目标Sqlserver服务器,并配置数据源名,且地址为安装了本地代理的服务器IP地址。

监控数据:

1.内存信息:锁所有者分配的区块、内存优化、内存授权等候、连接内存、锁所有者块、锁分配的区块、锁块、总服务器内存、目标服务器内存、SQL缓冲存储、最大工作空间内存、优秀内存授权、分配工作空间内存、锁定内存;

2.缓冲区信息:空闲页、保留页、程序缓存页、缓冲区击中率、惰写/秒、查找页/秒、被盗的页面、检查点页/秒、已读页/秒、已写页/秒、总页数、重读页/秒、空闲列区/秒、数据库页、目标页、页期望生命;

3.锁信息:平均等待时间、锁定超时/秒、锁定等待时间、锁定请求/秒、死锁/秒、锁定等待/秒;

4.SQL信息:失败自动参数化尝试/秒、安全自动参数化尝试/秒、批请求/秒、自动参数化尝试/秒、非安全自动参数化尝试/秒、SQL重编辑/秒、SQL编辑/秒;

5.闭锁信息:平均等待时间、总等待时间、锁定等待/秒;

6.缓存信息:使用的缓存/秒、缓存击中率、缓存页、缓存数、使用的缓存数;

7.数据库明细:日志销毁数、批量复制行/秒、REPL PENDING XACTS、日志增长、DBCC逻辑扫描字节数/秒、日志使用率、事务/秒、日志压缩、压缩移动数据大小/秒、数据文件大小、活动的事务、日志文件大小、批量复制的吞吐量/秒、日志刷新等待时间、日志缓冲区击中率、数据库名、日志缓冲区读/秒、已用日志文件大小、复制事务率、日志刷新字节数/秒、日志刷新/秒、备份/还原/秒、日志刷新等待/秒;

8.访问方法信息:范围扫描/秒、探针扫描/秒、完全扫描/秒;

9.用户连接信息:用户连接数、登入数/秒、离开数/秒。

输入参数

字段 含义说明
监视模式 包括:本地代理、远程模式
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
本地代理 地址 Sql server数据库所在主机的地址。
接入点 代理服务使用的接入点。该参数的选项来源,请参见“7.1代理接入点配置”。
数据源 被监视的Sql Sever数据源。可通过数据源列表选择,需先正确配置主机地址参数。
远程模式 数据库地址 Sql server数据库所在主机的地址。
数据库端口 数据库的端口,默认值为1433。
数据库用户名 数据库的用户名,配置的用户名必须有数据库系统性能表或视图的查询权限。
用户密码 用户名对应的密码。
数据库名 被监视的数据库的名称。
监视数据 监视的数据,包括库内存、缓冲区、缓存信息、数据库锁、闭锁信息、SQL信息、数据库明细、访问方式统计、用户连接,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数:

指标项 指标项描述 指标名 指标名描述
memory 内存信息 Lock_Owner_Blocks_Allocated 锁所有者分配的区块
Optimizer_Memory_KB 内存优化KB
Memory_Grants_Pending 内存授权等候
Connection_Memory_KB 连接内存KB
Lock_Owner_Blocks 锁所有者块
Lock_Blocks_Allocated 锁分配的区块
Lock_Blocks 锁定块
Total_Server_Memory_KB 总服务器内存KB
Target_Server_Memory_KB 目标服务器内存KB
SQL_Cache_Memory_KB SQL缓冲存储KB
Maximum_Workspace_Memory_KB 最大工作空间内存KB
Memory_Grants_Outstanding 优先内存授权
Granted_Workspace_Memory_KB 分配工作空间内存KB
Lock_Memory_KB 锁定内存KB
buffer 缓冲区信息 Free_pages 空闲页
Reserved_pages 保留页
Procedure_cache_pages 程序缓存页
Buffer_cache_hit_ratio 缓冲区击中率
Lazy_writes_sec 惰写/秒
Page_lookups_sec 查找页/秒
Stolen_pages 被盗的页面
Checkpoint_pages_sec 检查点页/秒
Page_reads_sec 已读页/秒
Page_writes_sec 已写页/秒
Total_pages 总页数
Readahead_pages_sec 重读页/秒
Free_list_stalls_sec 空闲列区/秒
Database_pages 数据库页
Target_pages 目标页
Page_life_expectancy 页期望生命
lock 锁信息 Average_Wait_Time_ms 平均等待时间ms
Lock_Timeouts_sec 锁定超时/秒
Lock_Wait_Time_ms 锁定等待时间ms
Lock_Requests_sec 锁定请求/秒
Number_of_Deadlocks_sec 死锁/秒
Lock_Waits_sec 锁定等待/秒
sqlStat SQL信息 Failed_Auto_Params_sec 失败自动参数化尝试/秒
Safe_Auto_Params_sec 安全自动参数化尝试/秒
Batch_Requests_sec 批请求/秒
Auto_Param_Attempts_sec 自动参数化尝试/秒
Unsafe_Auto_Params_sec 非安全自动参数化尝试/秒
SQL_Re_Compilations_sec SQL重编译/秒
SQL_Compilations_sec SQL编译/秒
latches 闭锁信息 Average_Latch_Wait_Time_ms 平均等待时间
Total_Latch_Wait_Time_ms 总等待时间
Latch_Waits_sec 锁定等待/秒
cache 缓存信息 Cache_Use_Counts_sec 使用的缓存/秒
Cache_Hit_Ratio 缓存击中率
Cache_Pages 缓存页
Cache_Object_Counts 缓存数
Cache_Objects_in_use 使用的缓存数
database 数据库明细 Log_Truncations 日志销毁数
Bulk_Copy_Rows_sec 批量复制行/秒
Repl_Pending_Xacts REPL PENDING XACTS
Log_Growths 日志增长
DBCC_Logical_Scan_Bytes_sec DBCC逻辑扫描字节数/秒
Percent_Log_Used 日志使用率
Transactions_sec 事务/秒
Log_Shrinks 日志压缩
Shrink_Data_Movement_Bytes_sec 压缩移动数据大小/秒
Data_Files_Size_KB 数据文件大小KB
Active_Transactions 活动的事务
Log_Files_Size_KB 日志文件大小KB
Bulk_Copy_Throughput_sec 批量复制的吞吐量/秒
Log_Flush_Wait_Time 日志刷新等待时间
Log_Cache_Hit_Ratio 日志缓冲区击中率
dbName 数据库名
Log_Cache_Reads_sec 日志缓冲区读/秒
Log_Files_Used_Size_KB 已用日志文件大小KB
Repl_Trans_Rate 复制事务率
Log_Bytes_Flushed_sec 日志刷新字节数/秒
Log_Flushes_sec 日志刷新/秒
Backup_Restore_Throughput_sec 备份/还原/秒
Log_Flush_Waits_sec 日志刷新等待/秒
method 访问方法信息 Range_Scans_sec 范围扫描/秒
Probe_Scans_sec 探针扫描/秒
Full_Scans_sec 完全扫描/秒
connection 用户连接信息 User_Connections 用户连接数
Logins_sec 登入数/秒
Logouts_sec 离开数/秒
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.5 Mysql

监控目的:

实时取得Mysql数据库的性能与运行状况数据,指导数据库的调整与调优。

监控前提:

配置所指定的用户必须具有数据库远程访问权限以及系统性能表/系统性能命令的执行权限,主要包括show databases、show variables、show status。

监控数据:

数据库基本信息、线程明细、请求统计、锁信息、查询统计、查询效率、主键效率、数据库明细、连接时间统计、连接与代理信息。

输入参数

字段 含义
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
数据库地址 Mysql数据库所在主机的地址。
服务端口 数据库的服务端口,默认值为3306。
用户名 登录Mysql数据库的用户名。配置的用户必须有数据库远程访问权限以及系统性能表/系统性能命令的执行权限。
用户密码 用户名对应的密码。
数据库名 被监视的数据库的名称。
监视数据 监视的数据,包括数据库描述、线程明细、请求统计、查询统计、锁信息、查询效率、主键效率、连接时间统计、数据库信息、连接与代理,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
threadsStatu 线程明细 threads_running 活动线程
threads_cached 缓存线程
thread_cache_size 线程缓存大小
requestStatu 请求统计 questions 请求/秒
bytes_sent 发送字节/秒
bytes_received 接收字节/秒
dbDescribe 数据库描述 db_type 数据库类型
database_host 数据库主机地址
database_port 数据库端口号
basedir 基本目录
datadir 数据目录
version 版本
queryStatu 查询统计 com_insert 插入查询/秒
com_select 选择查询/秒
com_update 提交查询/秒
com_delete 删除查询/秒
lockStatu 锁信息 table_locks_waited 锁等待
table_locks_immediate 直接锁定
queryHitRatio 查询效率 query_hit_ratio 查询缓存击中率
query_cache_limit 队列缓存限制
query_cache_size 队列缓存大小
primaryKeyHitRatio 主键效率 key_hit_ratio 主键击中率
key_buffer_size 主键缓冲区大小
key_cache_used 已用缓冲区大小
db_connect_time 连接时间统计 connected_time 连接时间(ms)
connect_timeout 连接超时(s)
database 数据库信息 db_name 数据库名称
db_table_num 表数目
db_zise 大小(MB)
connAndAgent 连接与代理信息 aborted_connects 断开的连接
aborted_clients 断开的客户端
threads_connected 活动的连接

11.2.6 Sybase

监控目的:

监视Sybase数据库的健康状况,性能以及资源使用状况。

监控前提:

首先必须确保监视器与被监控数据间网络连通,监视器配置的用户具有数据库系统性能表或视图的查询权限,监视器支持12.5.3及以上版本数据库。

监视数据:

1.数据库描述:数据库类型、版本、IP地址、端口、数据库服务名、连接时间;

2.数据库内存信息:内存大小、已用内存大小、空闲内存大小、使用率;

3.远程连接信息:连接总数、活动的连接数、空闲的连接数、使用率;

4.用户连接信息:连接总数、活动的连接数、空闲的连接数、使用率;

5.锁信息:锁总数、活动的锁、空闲的锁、利用率;

6.数据库信息:数据库名称、数据库创建者、类型、使用大小(MB)、大小(MB)、使用率(%);

7.命令信息:状态、主机名、ip地址、进程名、命令名、用户名、数据库名、物理读写、内存使用率、阻塞时间;

8.事务信息:事务类型、协作者名、开始时间、连接名称、状态、数据库ID、事务ID、事务名称、数据库名称、进程名。

输入参数

字段 含义
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
数据库地址 Sybase数据库所在主机的地址。
服务端口 数据库的服务端口,默认为5000。
用户名 登录Sybase数据库的用户名。配置的用户必须有系统性能表或视图的查询权限。
用户密码 用户名对应的密码。
数据库名 被监视的数据库的名称。
监视数据 监视的数据,包括数据库描述、数据库内存、远程连接、用户连接、数据库锁、数据库明细、命令明细、事务明细,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
dbDescribe 数据库描述 db_type 数据库类型
version 版本
database_host IP地址
database_port 端口
database_name 数据库服务名
connected_time 连接时间
dbMemory 数据库内存信息 totalMemory 内存大小
usedMemory 已用内存大小
freeMemory 空闲内存大小
usedRatio 使用率
dbRemoteConn 远程连接信息 totalRemoteConn 连接总数
activeRemoteConn 活动的连接数
freeRemoteConn 空闲的连接数
activeRemoteConnRatio 使用率
dbUserConn 用户连接信息 totalUserConn 连接总数
activeUserConn 活动的连接数
freeUserConn 空闲的连接数
activeUserConnRatio 使用率
dbLock 锁信息 totalLocks 锁总数
activeLocks 活动的锁
freeLocks 空闲的锁
activeLockRatio 利用率
dbDetails 数据库信息 db 数据库名称
creator 数据库创建者
segmap 类型
mbused 使用大小(MB)
mballocated 大小(MB)
usage 使用率(%)
dbCommandDetails 命令信息 status 状态
hostname 主机名
ipaddr ip地址
program_name 进程名
cmd 命令名
name 用户名
dbname 数据库名
physical_io 物理读写
memusage 内存使用率
time_blocked 阻塞时间
dbTransactionDetails 事务信息 type 事务类型
coordinator 协作者名
starttime 开始时间
connection 连接名称
state 状态
dbid 数据库ID
spid 事务ID
xactname 事务名称
dbname 数据库名称
program_name 进程名

11.2.7 Informix

监控目的:

用于监控INFORMIX数据库,提供数据库最关键的性能数据和资源使用状况。

监控前提:

监视器与被监控数据库间网络连通,配置的用户具有数据库系统性能视图及快照的执行权限。

监控数据:

1.数据库描述:数据库类型、版本、IP地址、端口、数据库服务名、连接时间;

2.数据库锁信息:数据库名、共享锁、更新锁、独占锁、其它锁;

3.表空间状态:名称、总页数、已使用、空闲率、块数、读/写次数、页读/页写次数、设备路径;

4.虚拟设备信息:虚拟设备名、类名、系统时间爱、用户时间;

5.数据库IO信息:数据库名、指定时间内锁请求、锁等待率、死锁率、读写/页读页写/缓冲区读缓冲区写以及扫描信息;

6.逻辑日志信息:日志ID、日志大小、使用大小、空闲率、各状态信息;

7.会话锁与事务信息:会话ID、顺畅率、等待率、死锁率、事务提交、撤销、长事务、日志写入;

8.会话IO信息:会话ID、读、写、复写、删除、缓冲区读写、页读写;

9.会话基本信息:会话ID、用户名、主机名、连接时间、状态、总排序、磁盘排序、内存排序率、库命中数、顺序扫描、锁保持;

10.数据库配置:数据库服务名、根用户、根路径、锁、缓冲区、物理文件等信息;

11.数据库表:数据库名、表个数、表占用页数。

输入参数

字段 含义
监视器名字 监视器的名称。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器开启开关。是:监视器开启;否:监视器关闭。默认为“是”。
数据库地址 Informix数据库所在主机的地址。
服务端口 数据库的服务端口,默认值为8888。
用户名 登录Informix数据库的用户名。配置的用户必须具有数据库系统性能视图及快照的执行权限。
用户密码 用户名对应的密码。
数据库服务名 被监视的数据库服务的名称。
监视数据 监视的数据,包括数据库描述、数据库锁、数据空间、虚拟设备、数据库IO、逻辑日志、会话锁、会话IO、会话基本信息、数据库配置、数据库表,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
dbDescribe 数据库描述信息 database_name 数据库服务名
db_type 数据库类型
connected_time 连接时间
database_host 数据库地址
database_port 数据库端口
version 数据库版本
dbLock 数据库锁信息 dbsname 数据库名
U 更新锁
X 独占锁
S 共享锁
dbspace 数据空间信息 name 名称
allocated 总页数
free 空闲
usage 使用率
blocks 块数
reads 读次数
writes 写次数
pagesread 页读次数
pageswritten 页写次数
fname 设备路径
dbVirtual 虚拟设备信息 vpid 设备ID
class 设备类名
usercpu 用户CPU时间
syscpu 系统CPU时间
dbIo 数据库IO信息 dbsname 数据库名
lockreqs 锁请求数
deadlks 死锁率
lockwts 锁等待率
lktouts 死锁超时率
isreads 读/分
isdeletes 删除/分
isrewrites 复写/分
iswrites 写/分
seqscans 顺序扫描/分
bufreads 缓冲区读/分
bufwrites 缓冲区写/分
pagwrites 页写/分
pagreads 页读/分
dbLogicLog 逻辑日志信息 uniqid 日志ID
size 日志大小
used 使用大小
freeratio 空闲率
is_temp 是否为临时
is_used 是否已使用
is_current 是否当前使用
is_archived 是否归档
sessionLock 会话锁与事务信息 sid 会话ID
smooth 顺畅率
wait 等待率
dead 死锁率
logrecs 逻辑日志记录写入
longtxs 长事务
iscommits 提交
isrollbacks 撤销
logspused 当前使用的日志字节
maxlogsp 逻辑日志使用的最大空间
max_sortdiskspace 排序使用的最大空间
dbSessionIo 会话IO信息 sid 会话ID
isreads
iswrites
isrewrites 复写
isdeletes 删除
pagreads 页读
pagwrites 页写
bufreads 缓冲区读
bufwrites 缓冲区写
dbSession 会话基本信息 sid 会话ID
username 用户名
hostname 主机名
connected 连接时间
state 状态
total_sorts 总排序
dsksorts 磁盘排序
memosorts 内存排序率
seqscans 顺序扫描
access 库命中数
locksheld 锁保持
dbCofig 数据库配置 dbservername 数据库服务名
rootsize 根大小
rootpath 根路径
buffers 缓冲区大小
rootname 根用户
locks 锁个数
logfiles 日志文件
physdbs 物理数据库
msgpath 消息路径
physfile 物理文件
dbMsg 数据库表 dbsname 数据库名
tablenum 表个数
size 表占用页数

11.2.8 DSG数据同步

监控目的:

监视DSG的状况。

监视前提:

源端发送文件名:默认为 $REALSYNC_BASE/xldr/[SERVICE_NAME]/2.cfg.senderno

源端日志目录: 默认为 $REALSYNC_BASE/log/$SERVICE_NAME

目标端装载文件名:默认为 $REALSYNC_BASE/xldr/[SERVICE_NAME]/real0/cfg.loaderno

目标端日志目录: 默认为 $REALSYNC_BASE/log/$SERVICE_NAME

目标端装载日志: 默认为 $REALSYNC_BASE/log/[SERVICE_NAME]/log.r0

其中 $REALSYNC_BASE 为DSG安装路径,[SERVICE_NAME]为DSG通道名

监控数据:

延迟时间:目标端发生时间减去源端发生时间之差

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
接入点 监视器接入的中间件网络。该参数的选项为业务导航中配置的区域。
源端地址 发送数据的主机地址。
源端发送文件名 发送文件的名称。
源端日志目录 源端日志存放的路径。
目标端地址 接收数据的主机地址。
目标端装载文件名 接收数据的文件的名称。
目标端日志目录 目标端日志存放的路径。
目标端装载日志 接收日志数据的日志文件的名称。
过滤关键字 监视器检索日志时,不显示包括过滤关键字的日志(多个关键字以”;”号隔开)。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
getSrcCaptureAndExport 获取分析完未传输完成的文件数量 ProcessedCount 已发送(文件个数)
ReadyCount 应发送(文件个数)
ReadyCount_ProcessedCount 待发送(文件个数)
getTgtImportAndPost 获取未装载的文件数量 ProcessedCount 已装载(文件个数)
ReadyCount 应装载(文件个数)
ReadyCount_ProcessedCount 待装载(文件个数)
getTgtImportInfo 获取详细装载信息 Xf1File 装载文件名
SrcTime 源端发生时间
DestTime 目标端发生时间
DelayElapsed 延迟时间
InsertCount 插入次数
UpdateCount 更新次数
DeleteCount 删除次数
DDLCount DDL次数
LoadTime Xf1File装载耗时
getSourceDGSLog 获取源端DSG日志 DetailContent 错误内容
OccurTimes 发生次数
LogPosition 文件路径
getTargetDGSLog 获取目标端DSG日志 DetailContent 错误内容
OccurTimes 发生次数
LogPosition 文件路径
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.9 DDS数据同步

监控目的:

监视DDS的状况。

监视前提:

源端发送文件名:默认为 $DDS_DATA/track/ctl.redoinfo

源端日志文件名: 默认为 $DDS_DATA/msg.err

目标端装载文件名:默认为 $DDS_DATA/put0/putfile.fno

目标端导入文件名:默认为$DDS_DATA/msg.log

目标端取坏表文件:默认为 $DDS_DATA/msg.tab

目标端日志文件名: 默认为 $DDS_DATA/msg.err

其中 $DDS_DATA 为DDS安装路径

监控数据:

1.延迟时间:目标端发生时间减去源端发生时间之差

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
接入点 监视器接入的中间件网络。该参数的选项为业务导航中配置的区域。
源端地址 发送数据的主机地址。
源端发送文件名 发送文件的名称。默认信息参考新建页面中的监视器说明部分。
源端日志过滤关键字 监视器检索源端日志时,不显示包括过滤关键字的日志(多个关键字以”;”号隔开)。
源端日志文件名 源端日志的名称。默认信息参考新建页面中的监视器说明部分。
目标端地址 接收数据的主机地址。
目标端装载文件名 接收数据的文件的名称。默认信息参考新建页面中的监视器说明部分。
目标端导入文件名 目标端获取导入信息的文件的名称。默认信息参考新建页面中的监视器说明部分。
目标端表文件名 目标端获取坏表信息的文件的名称。默认信息参考新建页面中的监视器说明部分。
目标端日志文件名 目标端日志的名称。默认信息参考新建页面中的监视器说明部分。
目标端日志过滤关键字 监视器检索目标端日志时,不显示包括过滤关键字的日志(多个关键字以”;”号隔开)。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
mf_GetSrcMergAndSendCount 获取分析完未传输完成的文件数量 ProcessedCount 已发送(文件个数)
ReadyCount 应发送(文件个数)
mf_GetTgtImportAndPost 获取未装载的文件数量 ProcessedCount 已装载(文件个数)
ReadyCount 应装载(文件个数)
mf_GetTgtImportInfo 获取目标端导入信息 FileName 装载文件名
InsertCount 插入次数
UpdateCount 更新次数
DeleteCount 删除次数
DDLCount DDL次数
IGNCount 忽略次数
ExecBadTable 坏表个数
LoadTime 文件装载耗时(ms)
DelayTime 加载延时时间(s)
NotUpdateTime 文件未更新时间(s)
mf_GetBadTableInfo 获取坏表信息 BadTableName 坏表名
Ower 坏表所有者
BadTime 坏表发生时间
mf_GetMsgErrInfoSource 获取源端DDS错误日志 Date 发生时间
Content 错误内容
ErrWord 错误级别
mf_GetMsgErrInfoTarget 获取目标端DDS错误日志 Date 发生时间
Content 错误内容
ErrWord 错误级别
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.10 DBF文件

监控目的:

监视DBF文件的状况。

监控数据:

最近更新日期、文件记录数、本次扫描文件记录数增量、文件字段数等

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 DBF文件所在主机的地址。
接入点 监视器接入的中间件网络。该参数的选项为业务导航中配置的区域。
dbf文件名 待监视的dbf文件的名称。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
mf_GetDbfFileInfo 获取dbf文件信息 FileName 文件名
FileKind 文件类型
LastUpdateDate 最近更新日期
RecordCount 文件记录数
CountIncremental 本次扫描文件记录数增量
FieldCount 文件字段数
agentError 异常信息 functionID 功能号
errorInfo 错误消息

11.2.11 PostgreSQL

监控目的:

监视PostgreSQL数据库的健康状况,性能以及资源使用状况。

监视前提:

首先必须确保监视器与被监控数据间网络连通,监视器配置的用户具有数据库系统性能表或视图的查询权限(如:pg_stat_all_indexes或者pg_proc等),若不能正常监视器到数据,请设置postgresql.conf配置文件中的STATS_START_COLLECTOR必须设置为真,同时设置变量 STATS_COMMAND_STRING, STATS_BLOCK_LEVEL,和 STATS_ROW_LEVEL 控制实际发送给收集器的数量。

监控数据:

1.缓存和事务 :提交每秒、回滚每秒、缓存击中每秒、缓存读每秒、缓存击中率;

2.锁信息:持有数、等待数;

3.查询与扫描:元组插入、元组更新、元组删除、顺序扫描、索引扫描、顺序读、索引读;

4.索引性能:索引扫描每秒、索引读每秒、索引抓取每秒;

5.表与索引空间:索引空间、磁盘空间;

6.连接与用户:用户数、连接数;

7.基本统计:版本、连接时间、表个数、触发器个数、存储过程个数;

8.大表TOP10:表名、表大小;

9.数据库:数据库名、数据库大小。

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 数据库所在主机的地址。
服务端口 数据库的服务端口。
用户名 登录数据库的用户名,配置的用户需具有数据库性能表或视图的查询权限。
用户密码 用户名对应的密码。
数据库名 待监视数据库的名称。
监视数据 监视的数据,包括缓存和事务、锁信息、查询与扫描、索引性能、连接与用户、基本信息统计、.大表TOP10和.数据库,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
bufferAndTrans 缓存和事务 commits 提交每秒
rollbacks 回滚每秒
bufhits 缓存击中每秒
bufreads 缓存读每秒
hitratio 缓存击中率
lockDetail 锁信息 isheld 持有数
iswait 等待数
queryAndScan 查询与扫描 rowsinserted 元组插入
rowsupdated 元组更新
rowsdeleted 元组删除
seqscans 顺序扫描
tindexscans 索引扫描
seqscansrowsread 顺序读
indscanrowreads 索引读
indexDetail 索引性能 indexscan 索引扫描每秒
indexread 索引读每秒
indexfetches 索引抓取每秒
tableAndIndexSpace 表与索引空间 indexsize 索引空间
diskspace 磁盘空间
connAndUser 连接与用户 users 用户数
availconnections 连接数
basicStat 基本统计 version 版本
connected_time 连接时间
tottables 表个数
tottriggers 触发器个数
totproc 存储过程个数
tableTopTen 大表TOP10 tablename 表名
tablesize 表大小
database 数据库 dbname 数据库名
size 数据库大小

11.2.12 MongoDB

监控目的:

用于监控MongoDB数据库,提供数据库最关键的性能数据和资源使用状况。

监控前提:

监视器与被监控数据库间网络连通,配置的用户具有Admin库的访问权限。

监控数据:

1.内存:已用物理内存:已用虚拟内存、映射文件、日志映射文件、物理内存大小、物理内存使用率;

2.数据库连接:当前连接数、可用连接数、创建总数;

3.网络流量:接收字节每秒、送字节每秒、接收请求每秒;

4.操作计数:插入、查询、更新、删除、迭代、命令;

5.维护错误:定期维护、告警维护、消息维护、用户维护、翻转数;

6.锁状态:总时间、锁定时间;

7.锁队列信息:总锁数、读锁、写锁;

8.锁活动客户端:总锁数、读锁、写锁;

9.后台清除:清除总数、总耗时、平均耗时、最后一次耗时、最后完成时间;

10.日报数据:提交到日报、写入到日报、写入到文件、压缩、写锁后提交、计划提交间隔前提交;

11.日报统计:真实时间、写准备时间、日报时间、写入数据文件时间、重分配时间;

12.游标:打开总数、客户端游标大小、超时总数;

13.索引:访问总数、命中数、偏差数、计数器重置数、偏差率、类型;

14.复制操作计数:重复插入、重复查询、重复更新、重复删除、重复迭代、重复命令;

15.复本信息:集合名、是否MASTER、第二节点是否位于副本集、副本节点集、仲裁节点、主节点、当前节点。

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 数据库所在主机的地址。
服务端口 数据库的服务端口。
用户名 登录数据库的用户名,用户需具有Admin库的访问权限。
用户密码 用户名对应的密码。
监视数据 监视的数据,包括CPU、内存、配置信息、操作状态、集群信息、集群节点信息、消息、线程池任务、挂起任务、Dynamic Endpoint Snitch,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
mem SS内存 resident 已用物理内存
virtual 已用虚拟内存
mapped 映射文件
mappedWithJournal 日志映射文件
totalRAM 物理内存大小
usedRatio 物理内存使用率
connections 数据库连接 current 当前连接数
available 可用连接数
totalCreated 创建总数
network 网络流量 bytesIn 接收字节每秒
bytesOut 送字节每秒
numRequests 接收请求每秒
opcounters 操作计数 insert 插入
query 查询
update 更新
delete 删除
getmore 迭代
command 命令
asserts 维护错误 regular 定期维护
warning 告警维护
msg 消息维护
user 用户维护
rollovers 翻转数
globalLock 锁状态 totalTime 总时间
lockTime 锁定时间
gLockcurrentQueue 锁队列信息 total 总锁数
readers 读锁
writers 写锁
gLockactiveClients 锁活动客户端 total 总锁数
readers 读锁
writers 写锁
backgroundFlushing 后台清除 flushes 清除总数
total_ms 总耗时
average_ms 平均耗时
last_ms 最后一次耗时
last_finished 最后完成时间
dur 日报数据 commits 提交到日报
journaledMB 写入到日报(MB)
writeToDataFilesMB 写入到文件(MB)
compression 压缩 (MB)
commitsInWriteLock 写锁后提交
earlyCommits 计划提交间隔前提交
timeMs 日报统计 dt 真实时间
prepLogBuffer 写准备时间
writeToJournal 日报时间
writeToDataFiles 写入数据文件时间
remapPrivateView 重分配时间
cursors 游标 totalOpen 打开总数
clientCursors_size 客户端游标大小
timedOut 超时总数
indexCounters 索引 accesses 访问总数
hits 命中数
misses 偏差数
resets 计数器重置数
missRatio 偏差率
indexType 类型
opcountersRepl 复制操作计数 insert 重复插入
query 重复查询
update 重复更新
delete 重复删除
getmore 重复迭代
command 重复命令
repl 复本信息 setName 集合名
ismaster 是否MASTER
secondary 第二节点是否位于副本集
hosts 副本节点集
arbiters 仲裁节点
primary 主节点
me 当前节点
dbs 库文件 db 数据库名
collections 集合数
objects 文档数
avgObjSize 文档平均大小
dataSize 数据大小
storageSize 已分配空间
indexSize 索引大小
fileSize 总空间大小
numExtents 扩充次数
collections 集合信息 ns 集合名
count 文档数
size 集合大小(MB)
avgObjSize 文档平均大小
storageSize 已分配集合空间
nindexes 索引数
totalIndexSize 索引大小
numExtents 扩充次数
paddingFactor 扩充因子

11.2.13 Cassandra

监控目的:

用于监控Cassandra数据库,提供数据库最关键的性能数据和资源使用状况。

监控前提:

监视器与被监控数据库间网络连通,被监控数据开放JMX服务和外部访问权限。

监控数据:

1.CPU:处理器个数、程序CPU使用时间、程序CPU使用率、系统CPU使用率;

2.内存:已用物理内存、物理内存大小、物理内存使用率;

3.配置信息:存储加载、例外、Token、启动时间(S)、数据中心名、机架名、代编号、压缩吞吐量每秒(MB)、流吞吐量每秒(MB)、加载字符串、提交日志位置、缓存保存位置、数据文件位置、发布版本、操作模式、消除状态、排流进程、是否加入集群、键空间、最小压缩阈值、最大压缩阈值、键缓存保存周期(S)、行缓存保存周期(S)、行缓存保存键、压缩策略类、初始化存储、服务是否启动、超时值(MS)、最大提示窗口每秒、当前最大提示、启用提示切换;

4.操作状态:范围操作、读操作、写操作、最近范围延迟、最近读延迟、最近写延迟;

5.集群信息:离开节点、移动节点、接入节点、断开节点、活跃节点;

6.集群节点信息:节点名、加载、状态;

7.消息:消息类型、丢弃数、最近丢弃数;

8.线程池任务:名称、完成任务、完成任务每秒、活动任务、挂起任务、阻塞任务、阻塞总数;

9.挂起任务:命令挂起、应答挂起、提交挂起、压缩挂起;

10.Dynamic Endpoint Snitch:坏阈值、重置间隔(ms)、更新间隔(ms)、类名称。

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 数据库所在主机的地址。
服务端口 数据库的服务端口。
用户名 登录数据库的用户名。
用户密码 用户名对应的密码。
监视数据 监视的数据,包括内存、数据库连接、网络流量、操作计数、维护错误、锁状态、锁队列信息、锁活动客户端、后台清除、日报数据、日报统计、游标、索引、复制操作计数、复制信息,可以选择一项或多项。
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
CPU CPU CPUCount 处理器个数
ProcessCpuTime 程序CPU使用时间
ProcessCpuLoad 程序CPU使用率
SystemCpuLoad 系统CPU使用率
memory 内存 used 已用物理内存
total 物理内存大小
usedRatio 物理内存使用率
configuration 配置信息 load 存储加载
ExceptionCount 例外
Token Token
uptime 启动时间(S)
DataCenterName 数据中心名
RackName 机架名
CurrentGenerationNumber 代编号
CompactionThroughputMbPerSec 压缩吞吐量每秒(MB)
StreamThroughputMbPerSec 流吞吐量每秒(MB)
LoadString 加载字符串
CommitLogLocation 提交日志位置
SavedCachesLocation 缓存保存位置
AllDataFileLocations 数据文件位置
ReleaseVersion 发布版本
OperationMode 操作模式
RemovalStatus 消除状态
DrainProgress 排流进程
Joined 是否加入集群
Keyspaces 键空间
MinimumCompactionThreshold 最小压缩阈值
MaximumCompactionThreshold 最大压缩阈值
KeyCacheSavePeriodInSeconds 键缓存保存周期(S)
RowCacheSavePeriodInSeconds 行缓存保存周期(S)
RowCacheKeysToSave 行缓存保存键
CompactionStrategyClass 压缩策略类
Initialized 初始化存储
RPCServerRunning RPC服务是否启动
RpcTimeout RPC超时值(MS)
MaxHintWindow 最大提示窗口每秒
MaxHintsInProgress 当前最大提示
HintedHandoffEnabled 启用提示切换
storageProxy 操作状态 RangeOperationsPS 范围操作
ReadOperationsPS 读操作
WriteOperationsPS 写操作
RecentRangeLatencyPS 最近范围延迟
RecentReadLatencyPS 最近读延迟
RecentWriteLatencyPS 最近写延迟
clusterDetails 集群信息 LeavingNodes 离开节点
MovingNodes 移动节点
JoiningNodes 接入节点
UnreachableNodes 断开节点
LiveNodes 活跃节点
clusterNodeDetails 集群节点信息 ClusterNodeName 节点名
ClusterNodeLoad 加载
ClusterNodeState 状态
msgService 消息 messageType 消息类型
dropped 丢弃数
recentlyDropped 最近丢弃数
stageCounters 线程池任务 poolName 名称
CompletedTasks 完成任务
CompletedPS 完成任务每秒
ActiveCount 活动任务
PendingTasks 挂起任务
CurrentlyBlockedTasks 阻塞任务
TotalBlockedTasks 阻塞总数
pendingTasks 挂起任务 CommandPendingTasks 命令挂起
ResponsePendingTasks 应答挂起
CommitlogPendingTasks 提交挂起
CompactionPendingTasks 压缩挂起
dynamicEndpointSnitch Dynamic Endpoint Snitch BadnessThreshold 坏阈值
ResetInterval 重置间隔(ms)
UpdateInterval 更新间隔(ms)
ClassName 类名称

11.2.14 Memached

监控目的:

用于监控Memcache数据库,提供数据库最关键的性能数据和资源使用状况。

监控前提:

监视器与被监控数据库间网络连通。

监控数据:

1.CPU:用户CPU时间、系统CPU时间、用户CPU使用率、系统CPU使用率;

2.内存:已用物理内存(MB)、物理内存大小(MB)、空闲物理内存(MB)、物理内存使用率;

3.击中率统计:击中数、未击中数、总数、击中率、类型;

4.连接信息:当前连接数、连接总数、连接结构数、是否达到连接峰值、失效监听数、主动放弃数;

5.存储数据信息:当前存储数、总存储数、LRU释放数、过期重存储数;

6.网络信息:读字节总数、写字节总数、读速度(KBps)、写速度(KBps);

7.命令执行统计:GET次数(PS)、SET次数(PS)、FLUSH次数(PS)、认证命令次数(PS)、认证失败次数(PS)、擦拭次数(PS);

8.基本信息:进程ID、运行时间(S)、系统时间、版本、操作系统指针大小、运行线程数;

9.事务状态:查询、存储、删除、总数;

10.配置信息:最大字节数,允许最大连接数,TCP端口,UCP端口,IP地址,日志级别,最老对象过期时间,是否禁用LRU,Socket域名,Socket的掩码,增加因子,chunk大小,线程数,每UDP线程数,stats分隔符,显示stats细节信息,最大IO吞吐量,是否启用CAS,TCP监控日志,绑定协议,是否启用SASL验证,数据最大尺寸,超最大连接是否立即关闭,初始Hash Power,SLAB重分派,SLAB自移动,最长修复时间,是否启动FLUSH。

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 memcache所在主机的地址。
服务端口 memcache所在的服务端口。
监视数据 监视的数据,包括CPU:用户CPU时间、系统CPU时间、用户CPU使用率、系统CPU使用率;内存:已用物理内存(MB)、物理内存大小(MB)、空闲物理内存(MB)、物理内存使用率;击中率统计:击中数、未击中数、总数、击中率、类型;连接信息:当前连接数、连接总数、连接结构数、是否达到连接峰值、失效监听数、主动放弃数;存储数据信息:当前存储数、总存储数、LRU释放数、过期重存储数;网络信息:读字节总数、写字节总数、读速度(KBps)、写速度(KBps);命令执行统计:GET次数(PS)、SET次数(PS)、FLUSH次数(PS)、认证命令次数(PS)、认证失败次数(PS)、擦拭次数(PS);基本信息:进程ID、运行时间(S)、系统时间、版本、操作系统指针大小、运行线程数;事务状态:查询、存储、删除、总数;配置信息:最大字节数,允许最大连接数,TCP端口,UCP端口,IP地址,日志级别,最老对象过期时间,是否禁用LRU,Socket域名,Socket的掩码,增加因子,chunk大小,线程数,每UDP线程数,stats分隔符,显示stats细节信息,最大IO吞吐量,是否启用CAS,TCP监控日志,绑定协议,是否启用SASL验证,数据最大尺寸,超最大连接是否立即关闭,初始Hash Power,SLAB重分派,SLAB自移动,最长修复时间,是否启动FLUSH
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
CPU CPU rusage_user 用户CPU时间
rusage_system 系统CPU时间
ratio_user 用户CPU使用率
ratio_sys 系统CPU使用率
memory 内存 used 已用物理内存(MB)
total 物理内存大小(MB)
free 空闲物理内存(MB)
usage 物理内存使用率
hitsAndMisses 击中率统计 hits 击中数
misses 偏差数
total 总数
hits_ratio 击中率
type 类型
connection 连接信息 curr 当前连接数
total 连接总数
structures 连接结构数
accepting_conns 是否达到连接峰值
disabled 失效监听数
yields 主动放弃数
items 存储数据信息 curr 当前存储数
total 总存储数
evictions LRU释放数
reclaimed 过期重存储数
expired_unfetched 重写未提取
evicted_unfetched 逐出未提取
network 网络信息 read 读字节总数
write 写字节总数
readKbps 读速度(KBps)
writeKbps 写速度(KBps)
cmd 命令执行统计 cmd_get GET次数(PS)
cmd_set SET次数(PS)
cmd_flush FLUSH次数(PS)
cmd_touch TOUCH次数(PS)
auth_cmds 认证命令次数(PS)
auth_errors 认证失败次数(PS)
cas_badval 擦拭次数(PS)
baseInfo 基本信息 pid 进程ID
uptime 运行时间(S)
time 系统时间
version 版本
pointer_size 操作系统指针大小
threads 运行线程数
reserved_fds 保留fds数
hash_power_level 哈希级别
hash_bytes 哈希大小
hash_is_expanding 哈希是否扩展中
malloc_fails MALLOC失败数
transaction 事务状态 get 查询
set 存储
del 删除
total 总数
configuration 配置信息 maxbytes 最大字节数
maxconns 允许最大连接数
tcpport TCP端口
udpport UCP端口
inter IP地址
verbosity 日志级别
oldest 最老对象过期时间
evictions 是否禁用LRU
domain_socket Socket域名
umask Socket的掩码
growth_factor 增加因子
chunk_size chunk大小
num_threads 线程数
num_threads_per_udp 每UDP线程数
stat_key_prefix stats分隔符
detail_enabled 显示stats细节信息
reqs_per_event 最大IO吞吐量
cas_enabled 是否启用CAS
tcp_backlog TCP监控日志
binding_protocol 绑定协议
auth_enabled_sasl 是否启用SASL验证
item_size_max 数据最大尺寸
maxconns_fast 超最大连接是否立即关闭
hashpower_init 初始Hash Power
slab_reassign SLAB重分派
slab_automove SLAB自移动
tail_repair_time 最长修复时间
flush_enabled 是否启动FLUSH

11.2.15 Couchbase

监控目的:

监控Couchbase的运行状态,包括Cluster Overview、Server Nodes和Data Buckets三个模块的状态及统计详情

监控数据:

Cluster Overview:集群的RAM和磁盘使用概述、数据桶总使用率、服务节点运行概述。

Server Nodes:节点的RAM使用率、CPU使用率、磁盘使用率等。

Data Buckets:数据桶的RAM使用率、CPU使用率、磁盘使用率等。

数据统计详情:统计各数据桶在服务节点上的使用情况,包括SERVER RESOURCES、SUMMARY、VBUCKET RESOURCES、DISK QUEUES、TAP QUEUES、DCP QUEUES、VIEW STATS: _DESIGN/BEER、QUERY、INCOMING XDCR OPERATIONS各项的详细统计信息和TOP KEYS统计信息

输入参数

字段 含义说明
监视器名字 监视器的名称。必填项。
轮询时间 监视器获取数据的时间间隔,为正整数,单位为s。必填项。默认值为30。
监视器是否运行 监视器运行开关。是:监视器运行;否:监视器不运行。默认为“是”。
主机地址 couchbase所在主机的地址。
端口号 Couchbase所在的服务端口。
用户名 登录couchbase的用户名。
用户密码 用户名对应的密码。
版本 Couchbase对应版本
监视数据 监视的数据,包括集群的RAM和磁盘使用概述、数据桶总使用率、服务节点运行概述,节点的RAM使用率、CPU使用率、磁盘使用率,数据桶的RAM使用率、CPU使用率、磁盘使用率,统计各数据桶在服务节点上的使用情况,包括SERVER RESOURCES、SUMMARY、VBUCKET RESOURCES、DISK QUEUES、TAP QUEUES、DCP QUEUES、VIEW STATS: _DESIGN/BEER、QUERY、INCOMING XDCR OPERATIONS各项的详细统计信息和TOP KEYS统计信息
数据采集 用于控制监控数据是否入库及入库规则。入库间隔为轮询时间*采集频率;如果监视器出现错误或告警,则根据错误、告警归并规则入库。
执行计划 用于设置监视器监视任务的执行时间。

输出参数

指标项 指标项描述 指标名 指标名描述
Cluster_Overview Cluster Overview ram_total_allocated RAM Total Allocated
ram_total_in_cluster RAM Total in Cluster
ram_unused RAM Unused
ram_in_use RAM In Use
ram_unallocated RAM Unallocated
disk_usable_free_space DISK Usable Free Space
disk_total_cluster_storage DISK Total Cluster Storage
disk_free DISK Free
disk_in_use DISK In Use
disk_other_data DISK Other Data
active_buckets Active Buckets
ops Operations per second
fetches Disk fetches per second
active_servers Active Servers Number
servers_failed_over Servers Failed Over Number
servers_down Servers Down Number
servers_pending_rebalance Servers Pending Rebalance Number
Servers_Node Servers Node server_node_name Server Node Name
is_failed_over Is Failed Over
is_pending_rebalance Is Pending Rebalance
server_status Server Status
groupname Group
ram_usage RAM Usage
swap_usage Swap Usage
cpu_usage CPU Usage
data_usage Data Usage
disk_usage Disk Usage
active_items Active Items
replica_items Replica Items
server_name Server Name
uptime Uptime
os OS
version Version
memory_cache_couchbase_quota Couchbase Quota Cache
memory_cache_total Total Cache
memory_cache_in_use In Use Cache
memory_cache_other_data Other Data Cache
memory_cache_free Free Cache
disk_storage_total Total Disk Storage
disk_storage_in_use In Use Disk Storage
disk_storage_other_data Other Data Disk Storage
disk_storage_free Free Disk Storage
Data_buckets Data Buckets bucket_name Bucket Name
bucket_type Bucket Type
nodes Nodes
item_count Item Count
ops Ops/sec
fetches Disk Fetches/sec
hitratio Hit Ratio
ram_usage RAM Usage
quota_usage Quota Usage
data_usage Data Usage
disk_usage Disk Usage
dynamic_ram_quota Dynamic RAM Quota
cluster_quota_cache Cluster quota Cache
other_buckets_cache Other Buckets Cache
this_bucket_cache This Bucket Cache
free_cache Free Cache
other_data_storage Other Data Storage
total_cluster_storage Total Cluster Storage
other_buckets_storage Other Buckets Storage
this_bucket_storage This Bucket Storage
free_storage Free Storage
SERVER_RESOURCES SERVER RESOURCES bucket_name Bucket Name
server_node_name Server Node Name
swap_used swap usage
mem_actual_free free RAM
cpu_utilization_rate CPU utilization
minor_faults Minor page faults
major_faults Major page faults
page_faults Page faults
curr_connections connections
rest_requests port 8091 reqs/sec
hibernated_requests idle streaming requests
hibernated_waked streaming wakeups/sec
SUMMARY SUMMARY bucket_name Bucket Name
server_node_name Server Node Name
ops ops per second
ep_cache_miss_rate cache miss ratio
cmd_get gets per sec
cmd_set sets per sec
delete_hits deletes per sec
cas_hits CAS ops per sec
vb_active_resident_items_ratio active docs resident
curr_items items
ep_tmp_oom_errors temp OOM per sec
ep_mem_low_wat low water mark
ep_mem_high_wat high water mark
mem_used memory used
ep_ops_create disk creates per sec
ep_ops_update disk updates per sec
ep_bg_fetched disk reads per sec
disk_write_queue disk write queue
couch_docs_data_size docs data size
couch_docs_actual_disk_size docs total disk size
couch_docs_fragmentation docs fragmentation
couch_total_disk_size total disk size
couch_views_data_size views data size
couch_views_actual_disk_size views total disk size
couch_views_fragmentation views fragmentation
couch_views_ops view reads per sec
xdc_ops Incoming XDCR ops/sec
replication_changes_left outbound XDCR mutations
ep_dcp_replica_items_remaining Intra-Replication Queue
query_requests N1QL queries/sec
index__data_size index data size
index__disk_size index disk size
index__fragmentation index fragmentation
index__num_rows_returned index scanned/sec
MEMCACHED MEMCACHED bucket_name Bucket Name
server_node_name Server Node Name
ops ops per sec
hit_ratio hit ratio
mem_used RAM used
curr_items items
evictions evictions per sec
cmd_set sets per sec
cmd_get gets per sec
bytes_written bytes TX per sec
bytes_read bytes RX per sec
get_hits get hits per sec
delete_hits delete hits per sec
incr_hits incr hits per sec
decr_hits decr hits per sec
delete_misses delete misses per sec
decr_misses decr misses per sec
get_misses get misses per sec
incr_misses incr misses per sec
cas_hits CAS hits per sec
cas_badval CAS badval per sec
cas_misses CAS misses per sec
VBUCKET_RESOURCES VBUCKET RESOURCES bucket_name Bucket Name
server_node_name Server Node Name
vb_active_num ACTIVE vBuckets
vb_replica_num REPLICA vBuckets
vb_pending_num PENDING vBuckets
ep_vb_total TOTAL vBuckets
curr_items ACTIVE items
vb_replica_curr_items REPLICA items
vb_pending_curr_items PENDING items
curr_items_tot TOTAL items
vb_active_resident_items_ratio ACTIVE resident
vb_replica_resident_items_ratio REPLICA resident
vb_pending_resident_items_ratio PENDING resident
ep_resident_items_rate TOTAL resident
vb_active_ops_create ACTIVE new items per sec
vb_replica_ops_create REPLICA new items per sec
vb_pending_ops_create PENDING new items per sec
ep_ops_create TOTAL new items per sec
vb_active_eject ACTIVE ejections per sec
vb_replica_eject REPLICA ejections per sec
vb_pending_eject PENDING ejections per sec
ep_num_value_ejects TOTAL ejections per sec
vb_active_itm_memory ACTIVE user data in RAM
vb_replica_itm_memory REPLICA user data in RAM
vb_pending_itm_memory PENDING user data in RAM
ep_kv_size TOTAL user data in RAM
vb_active_meta_data_memory ACTIVE metadata in RAM
vb_replica_meta_data_memory REPLICA metadata in RAM
vb_pending_meta_data_memory PENDING metadata in RAM
ep_meta_data_memory TOTAL metadata in RAM
DISK_QUEUES DISK QUEUES bucket_name Bucket Name
server_node_name Server Node Name
vb_active_queue_size ACTIVE items
vb_replica_queue_size REPLICA items
vb_pending_queue_size PENDING items
ep_diskqueue_items TOTAL items
vb_active_queue_fill ACTIVE fill rate
vb_replica_queue_fill REPLICA fill rate
vb_pending_queue_fill PENDING fill rate
ep_diskqueue_fill TOTAL fill rate
vb_active_queue_drain ACTIVE drain rate
vb_replica_queue_drain REPLICA drain rate
vb_pending_queue_drain PENDING drain rate
ep_diskqueue_drain TOTAL drain rate
vb_avg_active_queue_age ACTIVE average age
vb_avg_replica_queue_age REPLICA average age
vb_avg_pending_queue_age PENDING average age
vb_avg_total_queue_age TOTAL average age
TAP_QUEUES TAP QUEUES bucket_name Bucket Name
server_node_name Server Node Name
ep_tap_replica_count REPLICATION TAP senders
ep_tap_rebalance_count REBALANCE TAP senders
ep_tap_user_count CLIENTS TAP senders
ep_tap_total_count TOTAL TAP senders
ep_tap_replica_qlen REPLICATION items
ep_tap_rebalance_qlen REBALANCE items
ep_tap_user_qlen CLIENTS items
ep_tap_total_qlen TOTAL items
ep_tap_replica_queue_drain REPLICATION drain rate
ep_tap_rebalance_queue_drain REBALANCE drain rate
ep_tap_user_queue_drain CLIENTS drain rate
ep_tap_total_queue_drain TOTAL drain rate
ep_tap_replica_queue_backoff REPLICATION back-off rate
ep_tap_rebalance_queue_backoff REBALANCE back-off rate
ep_tap_user_queue_backoff CLIENTS back-off rate
ep_tap_total_queue_backoff TOTAL back-off rate
ep_tap_replica_queue_backfillremaining REPLICATION backfill remaining
ep_tap_rebalance_queue_backfillremaining REBALANCE backfill remaining
ep_tap_user_queue_backfillremaining CLIENTS backfill remaining
ep_tap_total_queue_backfillremaining TOTAL backfill remaining
ep_tap_replica_queue_itemondisk REPLICATION remaining on disk
ep_tap_rebalance_queue_itemondisk REBALANCE remaining on disk
ep_tap_user_queue_itemondisk CLIENTS remaining on disk
ep_tap_total_queue_itemondisk TOTAL remaining on disk
DCP_QUEUES DCP QUEUES bucket_name Bucket Name
server_node_name Server Node Name
ep_dcp_replica_count REPLICATION DCP connections
ep_dcp_xdcr_count XDCR DCP connections
ep_dcp_views_count VIEWS DCP connections
ep_dcp_other_count OTHER DCP connections
ep_dcp_replica_producer_count REPLICATION DCP senders
ep_dcp_xdcr_producer_count XDCR DCP senders
ep_dcp_views_producer_count VIEWS DCP senders
ep_dcp_other_producer_count OTHER DCP senders
ep_dcp_replica_items_remaining REPLICATION items remaining
ep_dcp_xdcr_items_remaining XDCR items remaining
ep_dcp_views_items_remaining VIEWS items remaining
ep_dcp_other_items_remaining OTHER items remaining
ep_dcp_replica_items_sent REPLICATION drain rate items/sec
ep_dcp_xdcr_items_sent XDCR drain rate items/sec
ep_dcp_views_items_sent VIEWS drain rate items/sec
ep_dcp_other_items_sent OTHER drain rate items/sec
ep_dcp_replica_total_bytes REPLICATION drain rate bytes/sec
ep_dcp_xdcr_total_bytes XDCR drain rate bytes/sec
ep_dcp_views_total_bytes VIEWS drain rate bytes/sec
ep_dcp_other_total_bytes OTHER drain rate bytes/sec
ep_dcp_replica_backoff REPLICATION backoffs/sec
ep_dcp_xdcr_backoff XDCR backoffs/sec
ep_dcp_views_backoff VIEWS backoffs/sec
ep_dcp_other_backoff OTHER backoffs/sec
VIEW_STATS_DESIGN__BEER VIEW STATS_DESIGN/BEER bucket_name Bucket Name
server_node_name Server Node Name
views5a222b8c920aa5e3a28b51ee7eb609a0data_size data size
views5a222b8c920aa5e3a28b51ee7eb609a0disk_size disk size
views5a222b8c920aa5e3a28b51ee7eb609a0accesses view reads per sec
QUERY QUERY bucket_name Bucket Name
server_node_name Server Node Name
query_requests requests/sec
query_selects selects/sec
query_avg_req_time request time(sec)
query_avg_svc_time service time(sec)
query_avg_response_size result size
query_errors errors
query_warnings warnings
query_avg_result_count result count
query_requests_250ms queries > 250ms
query_requests_500ms queries > 500ms
query_requests_1000ms queries > 1000ms
query_requests_5000ms queries > 5000ms
INCOMING_XDCR_OPERATIONS INCOMING XDCR OPERATIONS bucket_name Bucket Name
server_node_name Server Node Name
ep_num_ops_get_meta metadata reads per sec
ep_num_ops_set_meta sets per sec
ep_num_ops_del_meta deletes per sec
xdc_ops total ops per sec
TOP_KEYS TOP KEYS bucket_name Bucket Name
server_node_name Server Node Name
name Key
ops Ops/Sec

results matching ""

    No results matching ""